Corpus of the Contemporary Lithuanian Language

提供者:朱述承
访问地址:http://donelaitis.vdu.lt/main_en.php?id=4&nr=1_2

简介

当代立陶宛语在线语料库包含1.02亿个词,它是迄今为止最大的立陶宛语语料库。该语料库是旨在代表当前立陶宛语的文本集合。语料库提供特殊程序,可以进行语言单位的语言学,社会学和其他分析。

该语料库是一般的而不是专门的。它是根据阅读而编写的,而不是发布趋势。它不断增长,由全文组成,而不是片段。语料库的设计遵循其他欧洲语言(英语,德语,丹麦语,捷克语等)的一些语料库的原则。

该语料库由立陶宛独立时期(1990年以来)的印刷材料组成。该语料库旨在尽可能广泛地代表当代最广泛的立陶宛文字。该语料库的最大部分由普通出版社(地区和全国性报纸),大众出版社和特刊(专业报刊杂志)组成。这些文本是为一般读者和专家准备的。其余的语料库包括小说,回忆录,其他文献(科学和流行)以及各种官方文本。

相关论文

Marcinkevičienė R. Kompiuteriais kuriame tekstyną. – Darbai ir Dienos, 1996, Nr. 3, P. 257–258.
Marcinkevičienė R. Tekstynų lingvistika ir lietuvių kalbos tekstynas. – Lituanistica, 1997, Nr. 1 (29), P. 58–78.
Marcinkevičienė R. Klausimas dėl klausimo, arba ką gali kompiuterinis tekstynas. – Darbai ir Dienos, 1997, Nr. 5, P. 19–37.
Marcinkevičienė R. Parallel Corpora and Bilingual Lexicography. In: Germanic and Baltic Linguistic Studies and Translation. Proceedings of the International Conference, Vilnius, 22–24 April 1998. Ed. by A. Usonienė, Vilnius, 1998, P. 40–48.
Marcinkevičienė R. Atminties labirintuose. Kognityvinės ir tekstynų lingvistikos sąveika. – Darbai ir Dienos, 1999, Nr. 10 (19), P. 109–124.
Marcinkevičienė R. Tekstynas – tarpdalykinių ryšių sankirtos taškas. – Tarpdisciplininiai ryšiai lituanistikoje, Vilnius, 1999, P. 159–164.
Marcinkevičienė R. Hapax Legomena as a Platform for Text Alignment. – In Proceedings of the Third European Seminar Translation Equivalence, Montecatini Terme, Italy, October 16–18, 1997, P. 125–137.
Marcinkevičienė R. Tekstynų lingvistika TEORIJA IR PRAKTIKA. – Darbai ir Dienos, 2000, Nr. 24, P. 7–64.
Marcinkevičienė R. Patterns of Word Usage Viewed by Corpus Linguistics. – Kalbotyra, 2000, Nr. 49 (3), P. 71–80.
Marcinkevičienė R. Terminografija ir tekstynas. – Terminologija, 2000, Nr. 6, P. 5–22.
Marcinkevičienė R. Palyginamieji tekstynai – šaltinis tarptautinių žodžių vartosenai tirti. – Kalbotyra, 2002, Nr. 51 (3), P. 81–93.
Marcinkevičienė R., Bielinskienė A., Daudaravičius V., Rimkutė E. Corpora for Lithuanian Language Technologies. – In Proceedings of the First Baltic Conference Human Language Technologies. The Baltic Perspective, Riga, Latvia, April 21–22, 2004, P. 21–24.
Marcinkevičienė R. Dictionary of Lithuanian Phrases. – In Proceedings of the Eleventh EURALEX International Congress, EURALEX 2004, Lorient, France, July 6–10, 2004, ed. by Geoffrey Williams et Sandra Vessier: University of Bretagne. P. 741–751.
Marcinkevičienė R. The Importance of Syntagmatic Dimension in the Multilingual Lexical Database. – International Journal of Corpus Linguistics, 2001, Special Issue. P. 55–65.
Sinclair J. Lexical Grammar. – Darbai ir Dienos, 2000, Nr. 24, P. 191–203.
Tognini Bonelli E. Corpus Classroom Currency. – Darbai ir Dienos, 2000, Nr. 24, P. 205–243.
Utka A. Labai dažnų lietuvių kalbos žodžių ir žodžių formų ypatybės. – Lituanistica 1(61), 2005, P. 48–55.
Kovalevskaitė J. Dabartinės lietuvių kalbos tekstynas – 10 metų kaupimo ir naudojimo patirtis. – Prace Bałtystyczne, 2006, Nr. 3, P. 231–241.
Rimkutė E., Kovalevskaitė J. Daudaravičius V. Daugiakalbių tekstynų naudojimas ir taikymas. – Darbai ir Dienos, 2006, Nr. 45, P. 41–62.
Kalėdaitė V. Translating Existence (A Corpus-based Analysis).– Darbai ir Dienos, 2006, Nr. 45, P. 119–125.
Marcinkevičienė R. Patterns of word usage in corpus linguistics. – Corpus Linguistics. Critical Concepts in Linguistics (ed. by Wolfgang Teubert and Ramesh Krishnamurthy): Routledge, 2007, Vol. III, P. 85–96.
Marcinkevičienė R. The importance of the syntagmatic dimension in the multilingual lexical database. – Text Corpora and Multilingual Lexicography (ed. by Wolfgang Teubert): John Benjamins Publishing Company, 2007, P. 49–58.
Rimkutė E., Daudaravičius V., Utka A., Kovalevskaitė J. Bilingual Parallel Corpora for English, Czech and Lithuanian. Tarptautinės konferencijos The Third Baltic Conference on Human Language Technologies 2007 pranešimų medžiaga. Kaunas, 2008, P. 319–326.
Rimkutė E., Kovalevskaitė J., Melninkaitė V., Utka A., Vitkutė-Adžgauskienė D. Corpus of Contemporary Lithuanian Language – the Standardised Way. – Human Language Technologies – The Baltic Perspective: Proceedings of the Fourth International Conference Baltic HLT 2010, P. 154–160.